﻿ Secția Te h n o l o g i a și Știința Informației, Academia Română 27 ianuarie 2013 Contribuţii la dezvoltarea teoriei discursului și aplicaţii Dan Cristea Universitatea “Alexandru Ioan Cuza” din Iași – Facultatea de Informacă Academia Română, Filiala Iași – Instutul de Informacă Teorecă dcristea@info uaic ro Partea 1 • Note biograﬁce, cariera didaccă și de cercetare, colecvul, puri de acvităţi, temele principale de cercetare, cooperări, proiecte 2 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Studii • Diplomă de inginer în Calculatoare, la Universitatea Politehnica Bucureş, Facultatea de Automacă și Calculatoare, secţia Calculatoare, în 1975 • Diplomă în matemacă, la Universitatea “Alexandru Ioan Cuza” din Iaşi, Facultatea de Matemacă, în 1981 • Diploma de doctor inginer în Calculatoare, la Universitatea Politehnica Bucureş, Facultatea de Automacă și Calculatoare, în 1994 3 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Poziţii profesionale și funcţiile actuale – Profesor la UAIC-FII (din sept 2002) – Conducere de doctorat în Informacă (din 2005) – Director al Departamentului de Cercetare din UAIC-FII (din 2008) – Cercetător principal I (1/2 normă), la AR-IIT (din 2008) 4 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Cariera universitară • Cursuri predate la UAIC: – Informacă: Inteligenţă Arﬁcială, Programare Bazată pe Reguli, – Masterat: Probleme de Teoria Discursului, Introducere în Prelucrarea Limbajului Natural, Algoritmi şi Structuri de Date – Școala Doctorală UAIC-FII: Tehnici avansate de cercetare 5 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Conducerea de doctorat • 6 teze terminate (dintre care 2 în cotutelă) • 7 în derulare (dintre care 2 în cotutelă) • 3 studenţi exmatriculaţi (neîndeplinirea în termen a obligaţiilor) 6 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Recunoașterea presgiului profesional • Premiul Academiei (Secţia ȘTI) în 2001 • Sunt membru corespondent al Academiei de Şinţe Tehnice din România din 2002 • În decembrie 2006 am primit premiul cercetării, acordat de CNCSIS • În 2008 am primit premiul pentru acvitatea de cercetare, acordat de UAIC • Președintele Comisiei CNATDCU de Informacă (2004-2011, 2012-prezent) 7 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Recunoașterea presgiului profesional • Citări (conform Google Scholer ian 2013): – 735, dintre care 7 sunt în lucrări indexate ISI Web of Science • h-index = 14, i10-index = 18 • 110 conferinţe invitate și comunicări: – 58 în afara ţării; – 52 în ţară • Membru în comitete de program ale unor evenimente șinţiﬁce sau ca recenzor în reviste (numai din 2000) – aprox 100 de parcipări 8 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Recunoașterea presgiului profesional Sunt membru al organizaţiilor profesionale: – SIGDial – Special Interest Group in Dialogue and Discourse – USA, – Associaon de Recherches Cognives (ARC) – France, – Associaon of Computer Machinery (ACM) – USA, – Organizaţia Română de Inteligenţă Arﬁcială (membru fondator), – Comisia de Informazare pentru Limba Română din cadrul Academiei Române (neînregistrată) – vicepreşedinte pentru secţiunea Prelucrarea Limbajului Natural, – Consorţiul de Informazare pentru Limba Română (neînregistrată), 9 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Recunoașterea presgiului profesional Parcipări în comisii de doctorat în străinătate • Universitatea din Neuchatel (Elveţia) • Universitatea din Geneva (Elveţia) • Max-Planck Instute Nijmegen (Olanda) • Universitatea din Strassbourg (Franţa) • Universitatea Lille I (Franţa) • Universitatea din Trento (Italia) • Universitatea din Madrid (consultant) • Instutul de Matemacă – Informacă al Academiei de Șinţe a Moldovei (teză de doctor habilitat) 10 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Publicaţii • 185 de tluri (unele pot ﬁ consultate la hp:// www info uaic ro/~dcristea/publicaons): – 5 cărţi, dintre care 2 ca unic autor; – 5 cărţi editate; – 29 de capitole de cărţi; – 21 de arcole în jurnale; – 75 de lucrări publicate în proceedings-uri (42 internaţionale și 33 naţionale); – 44 de eseuri și alte publicaţii despre șinţă; – coautor la peste 100 de rapoarte de cercetare • Indexări: – 12 Web of Knowledge, 24 – DBLP, 14 – ACM, 12 – CiteSeer și 2 Cornwell University Library 11 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Componentele muncii mele de cercetare Elaborarea de modele teorece M Crearea de resurse și instrumente R I Validarea modelelor și a instrumentelor pe resursele create manual V Integrarea instrumentelor în aplicaţii A Publicaţii P Colaborări și parciparea în proiecte C Pr Parciparea în compeţii Organizarea de evenimente șinţiﬁce Predarea la catedră a descoperirilor 12 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Crearea de resurse lingvisce româneș • Dicţionare și tezaure: RoWordNet (în colaborare), eDTLR (în colaborare) • Corpusuri adnotate: RoTreeBank, RoVerbNet (în dezvoltare), RoFrameNet, speech2text aliniat (în dezvoltare), RoCoref, RoClSeg, RoSemClasses etc 13 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Crearea de instrumente de prelucrare a limbii române • Module: – Categorizer, ALPE, AnaMorph, DiacricsRecovery, LanguageIdenﬁer, tokeniser+POS-tagger+lemazer, NP-chunker, DependencyParser, ClauseSplier, DiscourseParser, RARE, Summarizer etc • Servicii web: – tokeniser+POS-tagger+lemazer, NP-chunker, DependencyParser, ClauseSplier, DiscourseParser, Classiﬁer 14 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Spectrul cercetărilor 1983-1987 IURES Sistem de întrebare-răspuns la baze de cunoșnţe semance R M ICI P A C 1985-1989 QUERNAL Sistem de întrebare-răspuns la baze de date R M ICI C P A Instutul de Cercetări Metalurgice, Intr Pr “Flamura Roşie” Sibiu, Ins Hidrologie Iași, Intr Extracţie Ţiţei Moineș 15 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Spectrul cercetărilor 1989-2004 L-Exp/PARLOG Limbaj dedicat descrierii aplicaţiilor de prelucrare a limbajului natural (teza de doctorat) I M P 1993-1994 MICH Morfologie prin clasiﬁcare: model mullingv de MULTI-MORPH ﬂexionare morfologică I M Univ Edinburg , Paris-Sud Orsay C P 1994-1995 PROSODICS Analiza formancă a semnalului vocal: idenﬁcarea frecvenţei fundamentale F0 și I M regăsirea traseelor prozodice ale enunţurilor vocale P A Univ Veneţia C 16 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Spectrul cercetărilor 1981-2011 Ana-Morph Morfologia paradigmacă a limbii române I R Acad Română – ICIA, DEX-online A C 1998-Dezvoltări ale Relaţia dintre structura discursului și prezent teoriilor referenţialitate, coerenţa și coeziunea discursului, discursului și generalizarea Centering Teoria Univ Pensylvania, Vasar College, Univ Nancy, R M Nervurilor ISI California, Univ Saarbruecken, IRST C Trento, Univ Sheﬃeld, Univ Toronto, Univ Penang I V - Mallaysia, Univ Marseille, Univ Sussex, Univ Paris-VII, Univ Humbold-Berlin etc P ALEAR Pr 1998-DiscPar Parser de discurs prezent Univ Sheﬃeld, Univ ATLANTIS – Atena, R M TETRACOM – Soﬁa, Polish Acad , Univ C Hamburg, Vassar College, Univ Lisabona, Univ I V Manchester, Univ Pompeu-Fabra Barcelona etc P A ATLAS, METANET4U Pr Spectrul cercetărilor 2004-AR-Engine Model mixt și mullingv de rezoluţie a anaforelor prezent RARE Univ Singapore, Univ ATLANTIS – Atena, R M TETRACOM – Soﬁa, Polish Acad , Univ C Hamburg, Vassar College, Univ Lisabona, Univ I V Manchester, Univ Pompeu-Fabra Barcelona etc P A ATLAS, METANET4U Pr 1994-ALPE Model ierarhic de organizare a workﬂow-urilor în prezent PLN Univ Tubingen, Univ Utrecht, Univ Malta, I M Univ Hamburg, Univ Manchester, C P LT4eL, CLARIN, METANET4U Pr 1997-2010 eDTLR Dicţionarul Tezaur al Limbii Române în format electronic R M Acad Română – Inst “Philippide” Iași, “Iordan-Rose” Bucureș, “Pușcariu” Cluj-C I V Napoca, ICIA-Bucureș, IIT-Iași, UAIC-Fac Litere P A eDTLR Pr Spectrul cercetărilor 2010-DAT Model și instrument de analiză a discoursului prezent AnaDiP polic R M UAIC-Dep Jurnalism, Univ Strasbourg I C V CIDO - Civic identy of online journals Pr P forums users: a pragmalinguisc perspecve A 2012-Hymas Model de asistent inteligent (a situaon aware prezent (Help Your discreet intelligent assistant) Master in Any IDIAP-Margny, Univ Hamburg, SIVECO, I M Situaon) Elhuyar Fundazioa-Spania, Univ Sao-Paolo C A SEAMA - Semanc Awareness in Mobile Pr Applicaons 2011 - SkyBooks Prelucrări textuale pe ﬂuxuri mari de date prezent Polish Acad , TUBITAK și KORTO Turcia, TETRACOM – Soﬁa, Univ Lisabona C MI Rolling Words, PROLIR, SkyBooks – Pr “animarea” cărţilor P Proiecte de cercetare • Proiecte instuţionale (valoarea pentru grupul coordonat de mine: > 1,5 Mil Eur) – europene: BALKANET, LT4eL, RoLTech, CLARIN, ALEAR, ATLAS, METANET4U – naţionale: ROTEL, InterOb, E-MANAGE, eDTLR, SIR- RESDEC, ALEAR-RO • Proiecte didacce – proiecte de an: >20 – proiecte de diplomă: >100 – proiecte de dizertaţie: >40 • Proiecte individuale în stagii internaţionale de cercetare: 8 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română 20 Organizare de manifestări șinţiﬁce • Seria de Școli de Vară în Prelucrarea Limbajului Natural EUROLAN (10 ediţii) • Iniţiator și coorganizator al seriei de conferinţe Resurse lingvisce și instrumente pentru prelucrarea limbii române al Consorţiului de Informazare pentru Limba Română – ConsILR (8 ediţii) • Iniţiator și coorganizator al seriei de manifestări BringITon: promovarea cercetării universitare în mediile industriale: 20011, 2012 (2 ediţii) 21 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română EUROLAN 1993-2011: 10 ediţii 22 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Organizare de manifestări șinţiﬁce ConsILR 2001-2012: 8 ediţii 23 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Alte preocupări • Literatură – Premiul de debut al Editurii Cartea Românească pentru anul 2009 cu romanul “Scaune de pluș” 24 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Partea 2 • Problemaca cercetărilor din zona discursului • Contribuţii personale în rezoluţia anaforei și relaţia dintre structura discursului și referenţialitate 25 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Text faţă de discurs Un text nu este neapărat un discurs! Dar devide discurs imediat ce este cit de un om sau de o mașină Cum este un text interpretat în mpul lecturii? Care sunt structurile pe care le construim în minte și cum ne ajută ele să avansăm cu lectura? În ce fel legăm referinţele de reprezentările pe care le construim? 26 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Teorii asupra discursului Teoria structurilor retorice: Mann and Thompson, 1987 – unitate elementară de discurs: propoziţia/clauza – relaţia retorică: între două segmente de text – argumentele relaţiilor sunt nuclee și sateliţi – analizele sunt arbori – analizele sunt subiecve‏ 27 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română O analiză RST 1 Farmington Police had to help control traﬃc recently 2 when hundreds of people lined up to be among the ﬁrst applying for jobs at the yet-to-open Marriot Hotel 3 The hotel’s help-wanted announcement – for 300 openings – was a rare opportunity for many unemployed 4 The people waing in line carried a message of claims that the jobless could be employed if only they showed enough moxie 5 Every rule has excepons, 6 but the tragic and too-common tableaux of hundreds of people snake-lining up for any task with a paycheck illustrates a lack of jobs, 7 not laziness 1-7 background 1-3 4-7 volional result evidence 2-3 5-7 4 circumstance concession 3 2 5 6-7 anthesis 28 Secţia de Șinţa Și Tehnologia Informaţiilor 6 7 – Academia Română Teorii asupra discursului Teoria centrelor: Grosz, Joshi and Weinstein, 1995 – segment: o secţiune a discursului care manifestă coerenţă – secvenţă de unităţi elementare de discurs: propoziţii/clauze – tranziţii între unităţile adiacente: grade de coerenţă, măsurabilă – condiţii de ulizare a pronumelor 29 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Ancipaţii (expectaons) în discurs Dan Cristea, Bonnie L Webber (1998) Expectaons in Incremental Discourse Processing In Proceedings of ACL '98 and EACL '98 – Indexări: ACM, DBLP, Conwell University Library, CiteSeer, Web of Knowledge – 44 citări – două operaţii (de la Tree Adjoining Grammars) în parsarea incrementală a discoursului: adjuncţia și substuţia – fronera dreaptă exnsă 30 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Adjuncţia 31 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Substuţia 32 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Fronera dreaptă exnsă Fronera dreaptă a subarborelui care are rădăcina în fratele stâng al celui mai interior nod substuţie * 33 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Expectaons-driven incremental parsing (Cristea and Webber, 1997) a Clinton is bound to win the elecons b He is a natural born campaigner c If you hold some posion on an issue, d then if Clinton wants to get your vote, e he will assure you with great sincerity that he holds that posion too 34 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română 8 Expectaons-driven incremental parsing a Clinton is bound to win the elecons b He is a natural born campaigner EVIDENCE b * a 35 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română 9 Expectaons-driven incremental parsing a Clinton is bound to win the elecons b He is a natural born campaigner c If you hold some posion on an issue, EVIDENCE EVIDENCE * ANT-CONS a b c ? 36 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română 13 Expectaons-driven incremental parsing a Clinton is bound to win the elecons b He is a natural born campaigner c If you hold some posion on an issue, EVIDENCE a EVIDENCE b ANT-CONS c ? 37 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română 14 Expectaons-driven incremental parsing a Clinton is bound to win the elecons b He is a natural born campaigner c If you hold some posion on an issue, d then if Clinton wants to get your vote, EVIDENCE a EVIDENCE b ANT-CONS ANT-CONS c? d ? 38 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română 16 Expectaons-driven incremental parsing a Clinton is bound to win the elecons b He is a natural born campaigner c If you hold some posion on an issue, d then if Clinton wants to get your vote, e he will assure you with great sincerity that he holds that posion too EVIDENCE a EVIDENCE b ANT-CONS c ANT-CONS d ? 39 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română 17 Expectaons-driven incremental parsing a Clinton is bound to win the elecons b He is a natural born campaigner c If you hold some posion on an issue, d then if Clinton wants to get your vote, e he will assure you with great sincerity that he holds that posion too EVIDENCE a EVIDENCE b ANT-CONS c ANT-CONS d e 40 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română 18 Teoria nervurilor Dan Cristea, Nancy Ide, Laurent Romary (1998) Veins Theory An Approach to Global Cohesion and Coherence In Coling '98 and ACL '98, Montreal – Indexări: ACM, DBLP, CiteSeer – 111 citări Dan Cristea, Nancy Ide, Daniel Marcu, Valenn Tablan (1999) Discourse Structure and Co-Reference: An Empirical Study, In ACL'99, Maryland – 38 citări Nancy Ide, Dan Cristea (2000) A Hierarchical Account of Referenal Accessibility In ACL'2000, Hong Kong – Indexări: ACM, DBLP, CiteSeer, Web of Knowledge – 26 citări Dan Cristea, Nancy Ide, Daniel Marcu, Valenn Tablan (2000) An empirical invesgaon of the relaon between discourse structure and co-reference In COLING'2000, Luxembourg – Indexări: ACM, DBLP – 20 citări Dan Cristea (2009) Movaons and implicaons of veins theory: a discussion of discourse cohesion In Internaonal Journal of Speech Technology 41 Secţia de Șinţa Și Tehnologia Informaţiilor – Indexări: ACM – Academia Română Teoria nervurilor – plasează la bază convenţii din RST, dar ignoră numele relaţiilor – noţiunea de nervură: un domeniul de referenţialitate al unităţilor decupat din arborele de discurs – conjectura coeziunii: o referinţă între unităţi este posibilă cu precădere când există o legătură structurală ierarhică între ele – conjectura coerenţei: generalizează Centering dincolo de restricţia de localitate 42 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Nervuri Expresia nervură a unui nod: secvenţa de unităţi necesare pentru înţelegerea textului acoperit de nod, în contextul întregului discurs în contextul întregului discurs: unităţile cele mai semniﬁcave ale textului acoperit de nod împreună cu altele din afara lui 43 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Regenţi și nervuri H=3 H=3 V=3 V=3 H=1 2 H=5 5 V=3 5 V=1 2 3 H=3 H=1 V=(1 2) 3 1 2 3 V=1 2 3 4 H=2 H=4 H=3 V=1 2 3 V=(1 2) 3 V=3 4 44 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Tipuri de referinţe evocave - procese de rezoluţie evocave: - un anafor poate avea ca antecedent o referinţă care nu este în mod necesar cea mai apropiată linear, ci doar cea mai apropiată ierarhic - se bazează pe asociaţii de proprietăţi morfologice, sintacce, semance - sunt rapide - dau ﬂenţă textului 45 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Tipuri de referinţe post-evocave - procese de rezoluţie post-evocave: - sunt mai încete computaţional (angrenează mecanisme cu mai mare încărcătură inferenţială), - necesită elemente referenţiale tari (de ex , nume proprii), - sunt mai puţin frecvente 46 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Din conjectura coeziunii: căutând pe nervuri, potenţialul de a găsi antecedenţi e mai mare 47 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Din conjectura coeziunii: efortul de a-i găsi e mai mic 48 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Măsurând coerenţa • Un scor al tranziţiilor: – CONTINUING = 4 – RETAINING = 3 – SMOOTH SHIFT =2 – ABRUPT SHIFT = 1 – NO Cb = 0 49 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Din conjectura coerenţei: scorul total Centering calculat pe nervuri e mai mare decât calculat linear 2 5 2 1 5 English French Romanian 1 Average 0 5 0 Average CT score per transion Average VT score per transion 50 Rezoluţia anaforei • Dan Cristea, Gabriela-Eugenia Dima (2001) An integrang framework for anaphora resoluon In Informaon Science and Technology, Romanian Academy Publishing House – Premiul "Grigore Moisil" în december 2003 – 13 citări • Dan Cristea, Oana Postolache, Gabriela-Eugenia Dima, Cătălina Barbu (2002) AR-Engine – a framework for unrestricted co-reference resoluon In LREC-2002, Las Palmas de Gran Canaria – Indexări: DBLP, CiteSeer – 25 citări • Dan Cristea, Gabriela-Eugenia Dima, Oana Postolache, Ruslan Mitkov (2002) Handling complex anaphora resoluon cases In Discourse Anaphora and Anaphor Resoluon Colloquium, Lisbon – 10 citări • Constann Orăsan, Dan Cristea, Ruslan Mitkov, Antonio Branco (2008) Anaphora Resoluon Exercise – An Overview In LREC-2008, Marrakech – Indexări: DBLP, CiteSeer 51 Secţia de Șinţa Și Tehnologia Informaţiilor – 12 citări – Academia Română Relaţia anafor – antecedent: coreferenţialitate Nivelul textului ………………………………………………………………………………………………………………………………… ………………………RE1 RE2 REk evocă DE RE propune DE RE2RE evocă DE 1k Nivelul semantic ……………………………… ……………………… DE a Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română 52 AR-engine: the architecture text AR-engine AR-model1 AR-model2 AR-model3 anaphoric links 53 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Partea a 3-a • Aplicaţii pracce ale cercetărilor mele din zona discursului, ulmele realizări de instrumente de prelucrare a limbajului natural • Planuri de viitor 54 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Un lanţ de rezumare automată în 6 limbi text Prerequisite Summarizer summary SEN text TOK POS LEM NP NER xml 55 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Un lanţ de rezumare automată în 6 limbi Prerequisite text Summarizer summary AR CS DP SUM summary SMO xml 56 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română ATLAS summariser versus SOA Daniel Anechitei, Dan Cristea, Ioannidis Dimosthenis, Eugen Ignat, Diman Karagiozov, Svetla Koeva, Mateusz Kopeć, Crisna Vertan (2013, to appear) Summarizing Short Texts Through a Discourse-Centered Approach in a Mullingual Context In Neustein, A , Markowitz, J A (eds ), Where Humans Meet Machines: Innovave Soluons to Knoy Natural Language Problems Springer Verlag, Heidelberg/New York Language BG DE EN GR PL RO AVG UAIC’s VT Summarizer P (H) 0 19 0 23 0 27 0 23 0 17 0 22 0 22 R (H) 0 29 0 44 0 41 0 41 0 36 0 32 0 37 F (H) 0 23 0 3 0 32 0 29 0 23 0 25 0 27 Open Text Summarizer P (H) 0 16 0 19 0 24 0 27 0 19 0 29 0 22 R (H) 0 25 0 2 0 22 0 33 0 21 0 06 0 21 F (H) 0 19 0 2 0 23 0 27 0 2 0 1 0 2 LexRank Summarizer P (H) 0 15 0 23 0 27 0 24 0 24 0 21 0 21 R (H) 0 18 0 25 0 25 0 22 0 24 0 22 0 18 F (H) 0 16 0 24 0 26 0 23 0 22 0 21 0 19 Proiecte de viitor • Prelucrări textuale în ﬂux connuu: propunerea de proiect SkyBooks – depusă în ianuarie 2013 • Recunoașterea situaţiilor SEAMA - Semanc Awareness in Mobile Applicaons – propunerea va ﬁ depusă în februarie • Îmbunătăţirea eDTLR și exploatarea lui – la IIT, în colaborare cu Academia • Construirea unui corpus aliniat vorbire-text – la IIT • Studii de morfologie diacronică românească – colaborare cu Inst Philippide 58 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Formarea de discipoli • NLP-Group: consolidat în cursul anilor la UAIC-FII, IIT și Inst Philippide – Un nucleu stabil de 7 colaboratori doctori – Restul (până la 15-18): • Post-doctoranzi îndrumaţi de mine • Studenţi doctoranzi conduși de mine • Masteranzi de Lingviscă Computaţională de talent • 28 de foș studenţi, neri doctori sau cercetători în domeniul Limbajului Natural • 10 doctori în diverse domenii care au colaborat sau au rămas în legături de colaborare cu NLP-Group 59 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română Vă mulţumesc! 60 Secţia de Șinţa Și Tehnologia Informaţiilor – Academia Română 